Correlação de Pearson, Spearman e Kendall
Análise de Dados Ambientais
Universidade Estadual de Feira de Santana (UEFS)
Investigando a associação entre duas variáveis
Definição
Exemplo:
Qual a relação entre o estresse no trabalho e o número de cigarros fumados em uma amostra de fumantes?
Três características da correlação:
Significância estatística (verificar se p < 0,05)
Direção (positiva ou negativa)
Grau (força: fraca, média e forte)
DIREÇÃO:
Positiva:** **Valores altos em uma variável (x) são associados a valores altos na outra (y). Valores baixos de x tendem a ser associados a valores baixos de y
Ex.: Idade da criança e capacidade de montar lego
Negativa:** **valores altos de uma variável (x) são associados a valores baixos da outra variável (y)
Ex.: Depressão e motivação para trabalhar
Nula:** **Não existe um relacionamento
Ex.: Altura e número de relacionamentos amorosos
DIREÇÃO:
Correlações
Positivas
Correlação Nula
Correlações Negativas
DIREÇÃO:
Correlações
Positivas
Correlação Nula
Correlações Negativas
DIREÇÃO:
Correlações
Positivas
Correlações Negativas
Correlação Nula
DIREÇÃO:
Correlações
Positivas
Correlações Negativas
Correlação Nula
DIREÇÃO:
Correlação perfeita
Sua idade e idade de sua irmã
Correlação imperfeita Inteligência lógico-matemática e nota
na prova de matemática
DIREÇÃO:
Pode ser que não se encontre correlação entre duas variáveis (usando método de cálculo de correlação linear) porque a relação existente é não-linear.
Teria que se usar outro método para cálculo da correlação (não-linear)
Ex. Idade vs. Força física (ou memória; ou comportamentos disruptivos)
COEFICIENTE DE CORRELAÇÃO
0
+1
Correlação** ****perfeita positiva**
COEFICIENTE DE CORRELAÇÃO
Cohen (1988, 1992)
| Magnitude | Valor absoluto |
|---|---|
| Nula | 0,00 |
| Fraca | |
| Moderada | |
| Forte |
COEFICIENTE DE CORRELAÇÃO
| Magnitude | Valor absoluto |
|---|---|
| Nula | 0,00 |
| Fraca | |
| Moderada | |
| Forte | |
| Muito Forte | |
| Perfeita | 1,00 |
TAMANHO** ****DE**** ****EFEITO**
Tamanho de efeito avalia o quanto duas variáveis estão, de fato, correlacionadas.
O tamanho de efeito da correlação explicita o quanto de variância compartilhada
duas variáveis apresentam entre si
TAMANHO DE EFEITO (COEFICIENTE DE DETERMINAÇÃO)
*r** *= 0,60
Coeficiente de Correlação
r2 = 0,36
36,0%
Tamanho de efeito
ou
Variância compartilhada
3%
17%
9%
| (r) | Variância compartilhada (tamanho de efeito, r2) |
|---|---|
| r = 0,10 | r2 = 0,01 = 1% |
| r = 0,20 | r2 = 0,04 = 4% |
| r = 0,30 | r2 = 0,09 = 9% |
| r = 0,40 | r2 = 0,16 = 16% |
| r = 0,50 | r2 = 0,25 = 25% |
| r = 0,60 | r2 = 0,36 = 36% |
| r = 0,70 | r2 = 0,49 = 49% |
| r = 0,80 | r2 = 0,64 = 64% |
| r = 0,90 | r2 = 0,81 = 81% |
| r = 1,00 | r2 = 10,0 = 100% |
CORRELAÇÃO PARAMÉTRICA VS NÃO-PARAMÉTRICA
Karl Pearson
(1857-1936)
Charles Spearman (1863-1945)
Correlação de Pearson vs.
Correlação de Spearman Correlação Kendall Tau-b
Maurice Kendall
(1907-1983)
CORRELAÇÃO PARAMÉTRICA VS NÃO-PARAMÉTRICA
| Kendall (Tau) | |
|---|---|
| Paramétrica | Não-paramétrica |
| Quando usar | |
| Quando os dados têm distribuição normal | Quando os dados não tem distribuição normal |
| Quando o número de participantes é alto | Útil também quando o número de participantes é baixo |
| Medida escalar/intervalar | Medida ordinal |
VAMOS** ****À**** ****PRÁTICA?**
HIPÓTESE:
Tabela de Correlação
| Variável | Deformação | Rigidez Secante | Módulo Yong | Máxima Carga | Resistencia tração | ||||
| Deformação | r de Pearson | - | |||||||
| Rigidez Secante | r de Pearson | 0.194 | - | ||||||
| Módulo Yong | r de Pearson | -0.275 * | 0.415 *** | - | |||||
| Máxima Carga | r de Pearson | 0.410 *** | 0.809 *** | 0.308 ** | - | ||||
| Resistencia tração | r de Pearson | 0.410 *** | 0.809 *** | 0.308 ** | 1.000 *** | - | |||
| p < .05, p < .01, p < .001, n.s = Não significativo |
TÓPICOS ESPECIAIS DE CORRELAÇÃO
DIFERENÇAS NOS NÍVEIS DE CORRELAÇÃO
Muitas vezes, quando realizamos análises de correlação, queremos entender, do
nosso conjunto de variáveis, quais são as que mais fortemente se correlacionam.
Os efeitos da deformação da fibra apresentaram associação positiva e significativa com a resistência à tração (r = 0,410; p < 0,001) e significativa e negativa para o Módulo Yong (r = -0,275; p < 0,05), sendo o primeiro mais fortemente correlacionado.
Forma de meia verdade!
| Variável | Deformação | Rigidez Secante | Módulo Yong | Máxima Carga | Resistencia tração | |||
| Deformação | - | |||||||
| Rigidez Secante | 0.194 | - | ||||||
| Módulo Yong | -0.275 * | 0.415 *** | - | |||||
| Máxima Carga | 0.410 *** | 0.809 *** | 0.308 ** | - | ||||
| Resistencia tração | 0.410 *** | 0.809 *** | 0.308 ** | 1.000 *** | - | |||
| p < .05, p < .01, p < .001, n.s = Não significativo |
DIFERENÇAS NOS NÍVEIS DE CORRELAÇÃO
Muitas vezes, quando realizamos análises de correlação, queremos entender, do
nosso conjunto de variáveis, quais são as que mais fortemente se correlacionam.
Fisher´s r-to-z transformation test
http://psychometrica.de/correlation.htm
| Variável | Deformação | Rigidez Secante | Módulo Yong | Máxima Carga | Resistencia tração | |||
| Deformação | - | |||||||
| Rigidez Secante | 0.194 | - | ||||||
| Módulo Yong | -0.275 * | 0.415 *** | - | |||||
| Máxima Carga | 0.410 *** | 0.809 *** | 0.308 ** | - | ||||
| Resistencia tração | 0.410 *** | 0.809 *** | 0.308 ** | 1.000 *** | - | |||
| p < .05, p < .01, p < .001, n.s = Não significativo |
DIFERENÇAS NOS NÍVEIS DE CORRELAÇÃO
Muitas vezes, quando realizamos análises de correlação, queremos entender, do
nosso conjunto de variáveis, quais são as que mais fortemente se correlacionam.
A análise de correlação indicou que a deformação das fibras apresentou correlação positiva e significativa com a resistência à tração (r = 0,410; p < 0,001), bem como correlação negativa e significativa com o módulo de Young (r = -0,275; p < 0,05). No entanto, dados de r-to-z de Fisher quanto a comparação entre os coeficientes de correlação não revelou diferença estatisticamente significativa entre essas associações (z = -2,885; p = 0,149).
| Variável | Deformação | Rigidez Secante | Módulo Yong | Máxima Carga | Resistencia tração | |||
| Deformação | - | |||||||
| Rigidez Secante | 0.194 | - | ||||||
| Módulo Yong | -0.275 * | 0.415 *** | - | |||||
| Máxima Carga | 0.410 *** | 0.809 *** | 0.308 ** | - | ||||
| Resistencia tração | 0.410 *** | 0.809 *** | 0.308 ** | 1.000 *** | - | |||
| p < .05, p < .01, p < .001, n.s = Não significativo |
TIPO ESPECIAL DE CORRELAÇÃO (PONTO
BISSERIAL)
Utilizada quando se pretende avaliar a relação entre uma variável ordinal (ou escalar, ex: altura) com outra variável dicotômica (ex: sexo - masculino e feminino).
Serve como um indício para saber se existem diferenças nos escores dos grupos em relação à variável de interesse.
Diferença do teste t (teste de média)
Resistência a punção
Sem Resina
Com Resina
CORRELAÇÃO** ****NÃO**** ****É**** ****CAUSALIDADE**
Correlação não é sinônimo de causalidade
A correlação entre duas variáveis pode ser causada por uma terceira variável oculta;
CORRELAÇÃO** ****NÃO**** ****É**** ****CAUSALIDADE**
Spurious Correlations
Ir à praia
Tomar
sorvete
TEMPERA TURA
CORRELAÇÃO** ****NÃO**** ****É**** ****CAUSALIDADE**
É possível encontrar uma correlação completamente espúria entre duas variáveis.
Spurious Correlations
CORRELAÇÃO (PARCIAL)
CORRELAÇÃO PARCIAL
Felicidade e Sentido de vida
Obrigado!
Luiz Diego Vidal Santos
Universidade Estadual de Feira de Santana (UEFS)
UEFS | Análise de Dados Ambientais | Análise de Correlação